check convergence |r| - 科学技術計算のためのマルチコアプログラミング入門第 Ⅰ 部 : 概要, 対象アプリケーション,OpenMP 中島研吾東京大学情報基盤センタ

end

solve_ICCG （ 7/7 ） : METHOD=1

!C +---+

!C | ALPHA= RHO / {p}{q} |

!C +---+

!C===

C1= 0.d0 do i= 1, N

C1= C1 + W(i,P)*W(i,Q) enddo

ALPHA= RHO / C1

!C===

!C +---+

!C | {x}= {x} + ALPHA*{p} |

!C | {r}= {r} - ALPHA*{q} |

!C +---+

!C===

do i= 1, N

X(i) = X(i) + ALPHA * W(i,P) W(i,R)= W(i,R) - ALPHA * W(i,Q) enddo

DNRM2= 0.d0 do i= 1, N

DNRM2= DNRM2 + W(i,R)**2 enddo

!C===

ERR = dsqrt(DNRM2/BNRM2) if (ERR .lt. EPS) then

IER = 0 goto 900 else

RHO1 = RHO endif

enddo IER = 1

Compute r

⁽⁰⁾

= b-[A]x

⁽⁰⁾

for i= 1, 2, …

solve [M]z

^(i-1)

= r

^(i-1)



_i-1

= r

^(i-1)

z

^(i-1)

if i=1

p

⁽¹⁾

= z

⁽⁰⁾

else



_i-1

= 

_i-1

/ 

_i-2

p

⁽ⁱ⁾

= z

^(i-1)

+ 

_i-1

p

⁽ⁱ⁾

endif

q

⁽ⁱ⁾

= [A]p

⁽ⁱ⁾



= 

_i-1

/p

⁽ⁱ⁾

q

⁽ⁱ⁾

x

⁽ⁱ⁾

= x

^(i-1)

+ 

p

⁽ⁱ⁾

r

⁽ⁱ⁾

= r

^(i-1)

- 

q

⁽ⁱ⁾

check convergence |r|

r= b-[A]x end

DNRM2=|r|

BNRM2=|b|

ERR= |r|/|b|

solve_ICCG2 （ 1/3 ） : METHOD=2

!C***

!C*** module solver_ICCG2

!C***

module solver_ICCG2 contains

!C*** solve_ICCG2

subroutine solve_ICCG2 &

& ( N, NPL, NPU, indexL, itemL, indexU, itemU, D, B, X, &

& AL, AU, EPS, ITR, IER) implicit REAL*8 (A-H,O-Z)

real(kind=8), dimension(N) :: D real(kind=8), dimension(N) :: B real(kind=8), dimension(N) :: X real(kind=8), dimension(NPL) :: AL real(kind=8), dimension(NPU) :: AU

integer, dimension(0:N) :: indexL, indexU integer, dimension(NPL):: itemL

integer, dimension(NPU):: itemU

real(kind=8), dimension(:,:), allocatable :: W integer, parameter :: R= 1

integer, parameter :: Z= 2 integer, parameter :: Q= 2 integer, parameter :: P= 3 integer, parameter :: DD= 4

real(kind=8), dimension(:), allocatable :: ALlu0, AUlu0 real(kind=8), dimension(:), allocatable :: Dlu0

Compute r

⁽⁰⁾

= b-[A]x

⁽⁰⁾

for i= 1, 2, …

solve [M]z

^(i-1)

= r

^(i-1)



_i-1

= r

^(i-1)

z

^(i-1)

if i=1

p

⁽¹⁾

= z

⁽⁰⁾

else



_i-1

= 

_i-1

/

_i-2

p

⁽ⁱ⁾

= z

^(i-1)

+ 

_i-1

p

^(i-1)

endif

q

⁽ⁱ⁾

= [A]p

⁽ⁱ⁾



= 

_i-1

/p

⁽ⁱ⁾

q

⁽ⁱ⁾

x

⁽ⁱ⁾

= x

^(i-1)

+ 

p

⁽ⁱ⁾

r

⁽ⁱ⁾

= r

^(i-1)

- 

q

⁽ⁱ⁾

check convergence |r|

end

solve_ICCG2 （ 2/3 ） : METHOD=2

!C +---+

!C | INIT |

!C +---+

!C===

allocate (W(N,4)) do i= 1, N

X(i) = 0.d0 W(i,1)= 0.0D0 W(i,2)= 0.0D0 W(i,3)= 0.0D0 W(i,4)= 0.0D0 enddo

call FORM_ILU0

!C===

Dlu0, ALlu0

，

AUlu0

には

ILU(0)

分解された対角，下三角，

上三角成分が入る（行列

[M]

）。

不完全修正コレスキー分解：正確には不完全修正 LU 分解 solver_ICCG2.f に附属

contains

!C***

!C*** FORM_ILU0

!C***

!C form ILU(0) matrix

subroutine FORM_ILU0 implicit REAL*8 (A-H,O-Z)

integer, dimension(:), allocatable :: IW1 , IW2 integer, dimension(:), allocatable :: IWsL, IWsU real (kind=8):: RHS_Aij, DkINV, Aik, Akj

!C +---+

!C | INIT. |

!C +---+

!C===

allocate (ALlu0(NPL), AUlu0(NPU)) allocate (Dlu0(N))

do i= 1, N Dlu0(i)= D(i) do k= 1, INL(i)

ALlu0(k,i)= AL(k,i) enddo

do k= 1, INU(i)

AUlu0(k,i)= AU(k,i) enddo

enddo

!C===

「

Dlu0,ALlu0,AUlu0

」初期値として，

「D,AL,AU」の値を代入する。

jk k j

k ik ij

a l d l

l   

^

 

 1

n i  1 , 2 ,  ,

1 , , 2 ,

1 

 i

j 

1 1 1

2 

 



 



 



  

 

ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

Dlu0, ALlu0，AUlu0にはILU(0)分解

された対角，下三角，上三角成分が入る（行列

[M]

）。

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

do i= 1, N do k= 1, i-1

if (A(i,k) is non-zero) then do j= k+1, N

if (A(i,j) is non-zero) then

A(i,j)= A(i,j) &

-A(i,k)*(A(k,k))

^-1

*A(k,j) endif

enddo endif enddo enddo

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

do i= 1, N

do k= 1, i-1

if (A(i,k) is non-zero) then do j= k+1, N

if (A(i,j) is non-zero) then

A(i,j)= A(i,j) &

-A(i,k)*(A(k,k))

^-1

*A(k,j) endif

enddo

endif

enddo

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

do i= 1, N

do k= 1, i-1

if (A(i,k) is non-zero) then do j= k+1, N

if (A(i,j) is non-zero) then

A(i,j)= A(i,j) &

-A(i,k)*(A(k,k))

^-1

*A(k,j) endif

enddo

endif

enddo

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

do i= 1, N

do k= 1, i-1

if (A(i,k) is non-zero) then do j= k+1, N

if (A(i,j) is non-zero) then

A(i,j)= A(i,j) &

-A(i,k)*(A(k,k))

^-1

*A(k,j) endif

enddo endif enddo enddo

j=i

jk k j

k ik ij

a l d l

l

 



^  

 1

n i

1,2,,

1 , , 2 ,

1 



i

j



1 1 1

2 

 



 



 



  





ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

jk k j

k ik ij

a l d l

l

 



^  

 1

n i

1,2,,

1 , , 2 ,

1 



i

j



1 1 1

2 

 



 



 



  





ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

do i= 1, N

do k= 1, i-1

if (A(i,k) is non-zero) then do j= k+1, N

if (A(i,j) is non-zero) then

A(i,j)= A(i,j) &

-A(i,k)*(A(k,k))

^-1

*A(k,j) endif

enddo endif enddo enddo

j<i

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

do i= 1, N

do k= 1, i-1

if (A(i,k) is non-zero) then do j= k+1, N

if (A(i,j) is non-zero) then

A(i,j)= A(i,j) &

-A(i,k)*(A(k,k))

^-1

*A(k,j) endif

enddo endif enddo enddo

j>i

jk k j

k ik ij

a l d l

l

 



^  

 1

n i

1,2,,

1 , , 2 ,

1 



i

j



1 1 1

2 

 



 



 



  





ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

実はこのIF文の中は通らない

（理由は後述）したがって，

ALlu0= AL AUlu0= AU

!C +---+

!C | ILU(0) factorization |

!C +---+

!C===

allocate (IW1(N) , IW2(N)) IW1=0

IW2= 0 do i= 1, N

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= k0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= k0

enddo

do icon= indexL(i-1)+1, indexL(i) k= itemL(icon)

D11= Dlu0(k) DkINV= 1.d0/D11

Aik= ALlu0(icon)

do kcon= indexU(k-1)+1, indexU(k) j= itemU(kcon)

if (j.eq.i) then

Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj Dlu0(i)= Dlu0(i) - RHS_Aij endif

if (j.lt.i .and. IW1(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW1(j)

ALlu0(ij0)= ALlu0(ij0) - RHS_Aij endif

if (j.gt.i .and. IW2(j).ne.0) then Akj= AUlu0(kcon)

RHS_Aij= Aik * DkINV * Akj ij0 = IW2(j)

AUlu0(ij0)= AUlu0(ij0) - RHS_Aij endif

enddo enddo

do k0= indexL(i-1)+1, indexL(i) IW1(itemL(k0))= 0

enddo

do k0= indexU(i-1)+1, indexU(i) IW2(itemU(k0))= 0

enddo enddo do i= 1, N

Dlu0(i)= 1.d0 / Dlu0(i) enddo

deallocate (IW1, IW2)

!C===

end subroutine FORM_ILU0

j>i

jk k j

k ik ij

a l d l

l

 



^  

 1

n i

1,2,,

1 , , 2 ,

1 



i

j



1 1 1

2 

 



 



 



  





ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

j<i

i

k

ある要素「

i

（○）」に接続する下三角成分「

k

（■○）」の上三角成分「

j

（■）」が：

（

1

）

「

i

」自身である場合，

Dlu

（■）更新

j=i

j

jk k j

k ik ij

a l d l

l   

^

 

 1

n i  1 , 2 ,  ,

1 , , 2 ,

1 

 i

j 

1 1 1

2 

 



 



 



  

 

ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

i

k

ある要素「

i

（○）」に接続する下三角成分「

k

（■○）」の上三角成分「

j

（■）」が：

（

2

）

「

i

」の下三角成分である場合

ALlu0(i-j)

（■）更新

j<i j

jk k j

k ik ij

a l d l

l   

^

 

 1

n i  1 , 2 ,  ,

1 , , 2 ,

1 

 i

j 

1 1 1

2 

 



 



 



  

 

ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

i

k

ある要素「

i

（○）」に接続する下三角成分「

k

（■○）」の上三角成分「

j

（■）」が：

（

3

）

「

i

」の上三角成分である場合

AUlu0(i-j)

（■）更新

実際は（

2

），（

3

）に該当する場合は無し

j>i

j

jk k j

k ik ij

a l d l

l   

^

 

 1

n i  1 , 2 ,  ,

1 , , 2 ,

1 

 i

j 

1 1 1

2 

 



 



 



  

 

ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

solve_ICCG2 （ 3/3 ） : METHOD=2

!C***************************************************** ITERATION ITR= N

do L= 1, ITR

!C +---+

!C | {z}= [Minv]{r} |

!C +---+

!C===

do i= 1, N

W(i,Z)= W(i,R) enddo

do i= 1, N WVAL= W(i,Z)

do k= indexL(i-1)+1, indexL(i)

WVAL= WVAL - ALlu0(k) * W(itemL(k),Z) enddo

W(i,Z)= WVAL * Dlu0(i) enddo

do i= N, 1, -1 SW = 0.0d0

do k= indexU(i-1)+1, indexU(i) SW= SW + AUlu0(k) * W(itemU(k),Z) enddo

W(i,Z)= W(i,Z) - Dlu0(i)*SW enddo

!C===

これ以下の処理は「

solve_ICCG

」と全く同じ

Compute r

⁽⁰⁾

= b-[A]x

⁽⁰⁾

for i= 1, 2, …

solve [M]z

^(i-1)

= r

^(i-1)



_i-1

= r

^(i-1)

z

^(i-1)

if i=1

p

⁽¹⁾

= z

⁽⁰⁾

else



_i-1

= 

_i-1

/ 

_i-2

p

⁽ⁱ⁾

= z

^(i-1)

+ 

_i-1

p

^(i-1)

endif

q

⁽ⁱ⁾

= [A]p

⁽ⁱ⁾



= 

_i-1

/p

⁽ⁱ⁾

q

⁽ⁱ⁾

x

⁽ⁱ⁾

= x

^(i-1)

+ 

p

⁽ⁱ⁾

r

⁽ⁱ⁾

= r

^(i-1)

- 

q

⁽ⁱ⁾

check convergence |r|

end

solve_ICCG2 （ 3/3 ） : METHOD=2

!C************************************************* ITERATION ITR= N

do L= 1, ITR

!C +---+

!C | {z}= [Minv]{r} |

!C +---+

!C===

do i= 1, N

W(i,Z)= W(i,R) enddo

do i= 1, N WVAL= W(i,Z)

do k= indexL(i-1)+1, indexL(i)

WVAL= WVAL - ALlu0(k) * W(itemL(k),Z) enddo

W(i,Z)= WVAL * Dlu0(i) enddo

do i= N, 1, -1 SW = 0.0d0

do k= indexU(i-1)+1, indexU(i) SW= SW + AUlu0(k) * W(itemU(k),Z) enddo

W(i,Z)= W(i,Z) - Dlu0(i)*SW enddo

!C===

実は，ALlu0，AUlu0の値はAL，AUと全く同じである。

METHOD=1

，

METHOD=2

の答え（反復回数）は同じ

   ^M ^z ^  ^LDL ^T  ^{   } ^z ^ ^r

     ^L ^z ^ ^r

  ^DL ^T ^{   } ^z ^ ^z

前進代入

Forward Substitution

後退代入

Backward Substitution

不完全修正コレスキー分解現在のようなメッシュの場合

jk k j

k ik ij

a l d l

l   

^

 

 1

n i  1 , 2 ,  ,

1 , , 2 ,

1 

 i

j 

1 1 1

2 

 



 



 



  

 

ⁱ ^k ⁱⁱ

k ik ii

a l d l

d

j i

j

□を満たすような（

i-j-k

）（

i,j

の両方に接続する

k

）が無い従って，

l _ij = a _ij

こういう場合は AUlu0, ALlu0 が更新される可能性あり

1 2 3 4 5

6 7 8 9 10

11 12 13 14 15

16 17 18 19 20

• 背景

–

有限体積法

–

前処理付反復法

• ICCG 法によるポアソン方程式法ソルバーについて

–

実行方法

•

データ構造

–

プログラムの説明

•

初期化

•

係数マトリクス生成

• ICCG法

• OpenMP

共有メモリ型計算機

ドキュメント内科学技術計算のためのマルチコアプログラミング入門第 Ⅰ 部 : 概要, 対象アプリケーション,OpenMP 中島研吾東京大学情報基盤センター (ページ 161-181)